r^ EBR- 
第 39 卷 第 8 其 计算 机 应 用 研究 ' oj. 39 No. 8 
录用 定稿 Application Research of Computers Accepted Paper 


基于 图 生成 过 程 的 跨 领域 推荐 
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摘 要 : 推荐 系统 在 各 方 各 面 得 到 充分 的 应 用 ， 时 刻 影 响 着 日 常生 活 。 要 训练 出 一 个 良好 的 推荐 系统 往往 需要 大 量 
的 “用 户 -商品 ”交互 数据 ， 但 是 实际 情况 下 获得 的 数据 往往 是 十 分 稀疏 的 ， 这 往往 会 使 得 训练 出 来 的 模型 过 拟 合 ， 
最 后 难以 获得 理想 的 推荐 效果 。 为 了 解决 这 个 问题 ， 跨 领域 推荐 系统 应 运 而 生 。 目 前 大 部 分 的 跨 领 域 推荐 系统 工作 
都 是 借鉴 传统 领域 自 适应 的 方法 ， 使 用 基于 特征 对 齐 或 者 对 抗 学 习 的 思想 将 领域 不 变 用 户 兴 趣 从 有 丰富 数据 的 源 域 
迁移 到 稀疏 的 目标 域 上 ， 例 如 豆 办 电影 迁移 到 豆 准 图书。 但 是 由 于 不 同 推荐 平台 的 网 络 结构 有 所 不 同 ， 现 有 的 方法 
暴力 提取 的 领域 不 变 的 语义 信息 容易 和 结构 信息 耦合 ， 导 致 错 配 现象 。 而 有 全 ， 现 有 的 方法 忽略 了 图 数据 的 本 身 存 在 
的 噪声 ， 导 致 实验 效果 进一步 受到 了 影响 。 为 了 解决 这 个 问题 ， 首 先 引入 了 图 数据 的 因果 数据 生成 过 程 ， 通 过 领域 
特征 隐 变 量 和 语义 特征 隐 变 量 、 唆 声 隐 变 量 解 耦 出 来 ， 通过 使 用 每 个 节 点 的 语义 隐 变 量 进行 推荐 ， 从 而 获得 领域 不 
变 的 推荐 效果 。 本 文 在 多 个 公开 数据 集 上 验证 了 本 文 的 方法 ， 并 取得 了 目前 最 好 的 实验 效果 。 
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Cross-domain recommendation under graph generation process 


Cai Ruichu?, Wu Fengzhu, Li Zijian 
(School of Computer Science, Guangdong University of Technology, Guangzhou 510006, China) 


Abstract: Recommendation systems are widely used everywhere and have a great influence on daily life. Aiming to train an 
ideal recommendation system, a massive of '*use-item' interactive pairs should be provided. However, the dataset obtained is 
usually sparse, which might result in an over-fitting model and be hard to obtain the satisfying performance. In order to address 
this problem, the cross-domain recommendation is raised. Most of the existing methods on cross-domain recommendation 
systems borrow the ideas of the conventional unsupervised domain adaptation, which employ the feature alignment or 
adversarial training methods. Hence they can transfer the domain-invariant interests of users from the source to the target 
domains, e. g. , from the Douban Movies to the Douban Books. However, since the network structures vary with different 
mu recommendation platforms, the existing methods on cross-domain recommendation systems straightforwardly extract the 


domain-invariant representation may entangle the structure information, which may result in the false alignment phenomenon. 
> < Furthermore, the previous efforts ignore the noise information behind the graph data, which further degenerate the 
4 5 experimental performance. In order to address the aforementioned problems, this paper brings the causal generation process 
of graph data into the cross-domain recommendation systems, this paper use the semantic latent variables of each node to 
calculate the relationships between users and items via disentangling the semantic latent variables, domain latent variables 
and noise latent variables. Experiments studies testify that the proposed method yields state-of-the-art performance on several 
cross-domain recommendation system benchmark datasets. 

Key words: disentanglement; graph neural networks; domain adaptation; recommendation system; causal generation process 


引言 解 和 神经 网 络 协同 过 滤 都 存在 冷 启 动 和 数据 稀疏 问题 。 

i 一 个 有 效 的 解决 方法 是 转移 相关 领域 的 知识 ， 跨 领域 推 
近年 来 ， 随 着 深度 学 习 技术 的 迅速 发 展 ， 深 度 学 习 在 各 ”其 由 技术 解决 了 这 类 问题 。 在 现实 生活 中 ， 用 户 通 常会 参与 
行 各 业 遍 地 开花 ， 其 中 的 一 个 应 用 是 推荐 系统 。 推 荐 系统 是 — 几 个 系统 来 获得 不 同 的 信息 服务 。 例 如 ， 用 户 在 在 线 视频 网 
为 推荐 商品 而 设计 的 特殊 软件 程序 ， 其 目标 是 从 海量 的 候选 ” 站 看 电影 的 同时 ， 从 知 乎 或 豆 办 等 网 站 浏览 书籍 评价 。 本 文 

| 


[e] 


测 用 户 未 来 最 可 能 交互 (点 击 、 评 价 、 购 买 等 ) 的 商 可 以 通过 跨 领 域 学 习 来 提高 目标 服务 (或 所 有 服务 ) 的 推荐 性 
品 。 协 同 过 滤 D(Collaborative filtering, CF) 方 法 是 推荐 系统 的 。 能 。 如 图 1(a) 所 示 ， 相 同 用 户 在 不 同 平台 的 行为 是 相似 的 ， 
基石 , 它 基于 用 户 过 去 的 交互 (如 产品 评分 ), 对 用 户 对 商品 的 。” 喜欢 看 西游 记 书 籍 的 人 ， 也 会 喜欢 看 西游 记 的 电影 。 按 照 上 
偏好 进行 建 模 。 和 矩阵 分 解 忆 (Matrix factorization, MF) 是 一 类 而 的 例子 ， 本 文 可 以 用 两 个 矩阵 分 别 表 示 视 频 与 图 书 的 浏览 
CF 2 它 通 过 分 解 用 户 和 物品 的 交互 矩阵 来 学 习 用 户 和 物 反馈， 通常 这 两 个 矩阵 是 高 度 稀疏 的 ， 同 时 学 习 它 们 有 益 于 
素 。 神 经 协同 过 滤 是 另 一 类 CF 方法 ， 利 用 神经 ”缓解 数据 稀疏 。 集 合 矩 阵 分 解 (Collective MF, CMF)PEE 1x2 
户 -物品 交互 函数 由。 然而 ， 传 统 的 矩阵 分 “方法 的 代表 ， 它 通过 共享 用 户 潜在 因素 来 共同 分 解 这 两 个 久 
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网 络 学 习 复杂 的 
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甫 助 域 的 CF 相 结合 实现 知 


ij, CMF 是 一 个 浅 层 模型 ， 难 以 学 习 复杂 的 月 
函数 。 另 一 类 方法 是 利用 图 神 
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户 兴趣 表示 ， 本 文 提出 了 一 种 基于 图 生成 过 程 的 跨 领 


域 推荐 方法 。 本文 假设 用 户 -物品 交互 图 的 生成 过 程 由 两 种 独 
立 的 潜在 变量 控制 ， 即 语义 潜在 变量 入" 和 域 潜在 变量 必 w 。 


经 网 络 [6"1(Graph Neural 


Network, GNN), 建 模 交 互 图 


B ere P 


图 卷 积 层 传播 节点 嵌入 ， tl 上 进行 下 游 的 推荐 任务 。 在 技术 上 , 本 文采 用 图 自 


户 ) 的 嵌入 来 强化 用 


编码 器 Ps 来 重建 这 些 潜 在 变量 ， 并 利 


阶 连接 中 的 协同 信号 


到 卷 积 层 ， 本 文 可 以 在 节点 戏 入 中 捕获 
， 以 此 缓解 数据 稀疏 的 问题 。 


见 有 的 方法 一 定 程度 上 缓解 
是 这 些 方 法 大 多 是 简单 


了 跨 领 域 推 


个 潜在 变量 的 重 构 和 分 解 ， 本 文 可 以 很 容易 地 在 


得 分 预测 器 和 领域 分 


m 


类 器 来 分 解 语义 和 领域 潜在 变量 。 大 量 的 实验 研究 表明 ， 本 
去 在 多 个 公开 数据 集 上 的 性 能 优 于 目前 的 跨 领 域 推 才 


EIE 


领域 不 变 和 


使 得 不 同 ) 


提出 基于 图 生成 过 程 的 跨 领 域 推荐 系统 ， 其 研究 意 


的 信息 ， 但 是 暴力 
使 得 领域 特有 的 结构 信息 和 和 领域 


首先 ， 跨 领域 推荐 能 同时 利用 多 个 数据 源 ， 解 决 推 
荐 系统 中 经 常 面临 的 冷 启动 问题 和 数据 稀 琉 问题 ， 其 次 ,， 目 


] 户 信息 迁移 错误 。 轨 领域 推荐 研究 大 都 是 针对 传统 的 深度 神经 网 络 模型 ， 


妈 1(b) 所 示 ， 现 有 方法 
导致 错 配 现象 。() 


变 表 达 中 同时 语义 信 
户 对 齐 的 现象 (例如 明 


息 和 结构 信息 厢 合 ， 那 么 会 
孩 迁 移 到 女孩 )， 最 终 导 致 不 理 


。 为 了 解决 这 个 问题 ， 
0 结构 信息 解 耦 出 来 ， 然 后 在 
息 ， 从 而 可 以 避免 结构 信 
十 候 通 过 解 耦 出 语义 隐 变 量 ， 
FE 的 影响 ,从 而 能 够 进行 有 效 的 迁移 ,可 以 通过 舍弃 不 局 


ESTE 


个 直观 的 解决 方法 是 将 语义 
推荐 的 时 候 只 
E. 如 


HAB. SATA 
IPERE), 2 


对 更 复杂 的 图 网 络 探讨 较 少 ， 特 别 是 如 何 解 决 领域 特有 的 结 
构 信 息 和 领域 不 变 的 用 户 兴趣 信息 的 耦合 ， 还 存在 很 多 这 六 


万 
究 空白 ， 最 后 ， 本 文 首次 在 跨 领 域 推荐 中 引入 了 因果 


过 因果 数据 生成 过 程 提升 了 模型 的 稳定 性 和 和 鲁 棒 性 。 


相关 工作 
1.1 推荐 系统 


E 荐 系统 由 在 从 用 户 的 历史 行为 中 了 解 他 们 对 未 知 物品 


避免 领域 特有 的 结构 
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荐 平台 数据 中 的 结构 信息 ， 使 得 相同 用 
的 行为 得 到 对 齐 。 


的 跨 领 域 推荐 系统 例 了 


Fig. 1 A simple example of cross-domain recommendation system 


中 义 信息 和 结构 信息 解 看 
HERH 


。 现 有 的 推荐 系统 可 以 分 为 基于 内 容 的 推荐 (Content- 
Recommendation) 5j H} [m] E 3E (Collaborative Filtering, 

大 类 。 基 于 内 容 的 推荐 是 基于 用 户 画 像 和 物品 描 
述 之 间 的 匹配 。 当 缺少 关于 物品 的 内 容 描述 时 ， 基 于 内 容 推 
的 方法 难以 为 每 个 用 户 构建 个 性 化 的 画像 。 协 同 过 滤 通 过 
户 与 物品 交互 行为 预测 用 户 偏好 , 与 物品 的 内 容 无 关 ， 
久 此 缓解 内 容 信 息 稀缺 的 问题 。 洪 在 因子 模型 主要 基于 和 矩阵 


# (Matrix Factorization，ME)DI 学 习 用 户 和 物品 的 特征 向 
概率 解释 。 分 解 机 (Factorization Machines, FM)I31 是 


义 的 矩阵 分 解 ， 能 有 效 建 模 多 种 特征 之 间 的 交互 。 神 经 协同 
过 滤 (Neural Collaborative Filtering, NCF)Bl 把 深度 神经 网 络 与 
阵 分 解 相 结合 ， 学 习 非 线性 的 特征 表示 。 然 而 ， 真 实 世 界 
4 用 户 - 物 品 交互 数据 是 高 度 稀 玻 的, 导致 协同 过 滤 模型 在 训 
IE/E E A E K AUN 
领域 推荐 (Cross-domain Recommendation) 1451 的 


日 源 领域 充足 的 数据 ， 绥 解 目标 领 域 的 用 户 行为 稀缺 


集合 矩阵 分 解 (Collective MF ，CMF)09。 上 述 浅 层 的 方 
法 , 在 学 习 高 度 非 线 性 的 复杂 用 户 -物品 交互 关系 方面 存在 困 
E。 此 外 ，DARect17] 借 鉴 迁移 学 习 中 的 域 自 适应 技术 进行 
推荐 ，TMCDR03 借 助 模型 无 关 的 元 学 习 解 决 跨 领 


司 领域 (如 不 同 的 推荐 
司 推荐 平台 的 噪声 。 必 "， 
量 和 噪声 隐 变 


启动 问题 。 


FE) y 表示 不 同 用 


类 把 矩阵 分 解 应 用 于 每 个 域 的 跨 领 域 推荐 方法 ， 


的 


E 


本 文通 过 引入 图 数据 的 因果 数据 生成 过 程 ， 将 语义 隐 变 


WERL CI OM ONE 


Ea 


H 


领域 隐 变 量 同 时 解 耦 出 来 ， 从 而 避免 了 由 结构 引起 的 用 
言 息 错 配 ， 获 得 更 好 的 迁移 效果 。 
1.2 图 神经 网 络 

另 一 个 相关 的 研究 领域 是 基于 用 户 -物品 二 部 图 结构 i 
行 推荐 ， 近 年 来 出 现 的 图 神经 网 络 (Graph Neural Networks, 


GNN)57 广 泛 应 用 于 图 结构 数据 的 建 模 ， 尤 其 是 高 阶 邻 居 ， 


以 指导 节点 表示 的 学 习 。 早 期 的 研究 定义 了 谱 域 上 的 图 卷 积 ， 


基于 拉 普 拉 斯 特征 分 解 和 Chebyshev 多 项 式 的 图 卷 积 0?1， 


ali: 


这 类 方法 需要 计算 拉 普 拉 斯 矩阵 的 着， 计算 复杂 度 较 高 。 


果 数 据 生成 过 程 
Fig.2  Causal data generation process based on graph data 


于 上 述 针 对 图 数据 的 数据 4 


成 过 程 ， 并 提取 的 领域 不 


如 卷 积 网 络 (Graph Convolutional Networks, GCN)ISjI 
GraphSAGED 在 空间 域 中 重新 定义 了 基于 消息 传递 的 图 卷 积 ， 
聚合 邻居 的 表示 来 活 得 目标 节点 的 表示 。 由 于 其 可 解 
性 和 计算 高 效 ， 它 们 迅速 成 为 一 种 流行 的 图 神经 网 络 范 子 
并 被 广泛 应 用 po2ll。 得 益 于 图 卷 积 的 强大 表达 能 力 ， 大 量 基 


202204.00063v1 


chinaXiv 


录用 定稿 


LightGCNP?Md: GCN 适 


于 图 网 络 的 推荐 模型 被 提出 户 2, 如 GC-MCP"I, NGCEPSHRI 


和 低层 次 的 结构 特 怕 


于 用 户 -物品 交互 图 的 建 模 ， 捕 获 
目标 节点 高 阶 邻 居 的 协同 过 滤 信 号 进行 推荐 。 在 最 近 的 基 


推荐 的 多 样 性 和 稳健 性 


些 研 究 把 跨 领 域 推荐 与 图 神经 网 络 相 结合 ， 例 如 
一 个 跨 领 域 偏好 矩阵 来 对 不 同 领域 的 交互 作 


1 练 的 随机 三 进 制 掩 码 ， 以 此 提高 


SGLB0 探 索 了 对 用 户 -物品 图 的 自 
; SGCNBU 
E, Æ GCN 的 每 一 层 都 


GCN 的 推 


于 图 网 络 推荐 的 研究 中 ， 
监督 学 习 ， 以 提高 GCN 
利用 图 的 稀 玻 性 
附加 了 一 个 可 i 
荐 性 能 。 

还 有 
PPGNB?I 4E T 
为 一 个 整体 进行 建 模 ， 以 
传播 方式 ，CD-GNNDB3] 在 
异 构图 上 学 
荐 。 本 文 将 图 神经 网 络 应 
经 网 络 的 点 聚合 能 力 ， 学 


更 好 的 捕捉 用 户 偏好 在 交互 图 中 的 
由 社交 网 络 与 用 户 浏 览 记 录 组 成 的 
习 用 户 的 表示 ， 然 后 提取 的 领域 不 变 特征 用 于 推 


习 出 不 同 的 隐 变 量 。 


2 ”基于 图 生成 过 程 的 跨 领域 推荐 
2.1 问题 定义 


给 定 两 个 领域 , 一 个 源 领域 (例如 ， 
领域 (例如 , 书籍 推荐 )， 两 个 领域 重合 的 用 户 集合 记 为 Y， 源 
领域 和 目标 领域 的 物品 分 别 记 为 和 。 
是 隐 式 反馈 的 协同 过 滤 问 题 。 


图 9 来 描述 


所 示 。 
在 商品 


E 荐 任务 


而 物品 根据 


5 


w = f (u,v |©) 


用 到 图 生成 过 程 中 建 模 ， 


利用 图 神 


电影 推荐 ) 和 一 个 目标 


每 个 领域 的 任务 都 
对 于 源 领 域 ， 本 文 用 一 个 无 向 
用 户 与 物品 的 交互 ， 图 有 入 两 类 节点 ， 如 果 
HP ueu 与 物品 "sY 存在 交互 ， 则 在 u 与 v 之 间 置 一 条 边 。 
对 于 目标 领域 ， 以 同样 的 方法 构建 9 。 本 文 的 符号 表 如 表 1 


， 每 个 用 户 只 对 前 N 个 物品 感 兴趣 ， 
他 们 的 预测 评分 排序 ， 公 式 如 下 : 


(1) 


其 中 , f 是 交互 函数 ，@ 是 模型 参数 。 PEREDE 3H K 
数 是 固定 的 点 积 ， 公 式 如 下 : 


RB. eei 


“ple ei “是 用 户 u 与 物品 v R32 


Gr. EMT 
Yuy 二 eue， 


El 


Q) 


ERA HÆ, 


IE A 781 22 i E H BLAN T8] E E XL BI] RN RELIER 
Vei ^" 。 在 跨 领 域 推荐 任务 中 , 本 文 利用 两 个 领 


U e, ^ 和 


同 训练 模型 ， 通 过 知识 迁移 来 提高 模型 表现 。 
表 1 符号 表 
Tab. 1 Notation table 


或 的 数据 协 


符号 描述 
U, Vs, Vi 户 节 点 、 源 领域 物品 节点 与 目标 领域 物品 节点 
UVV 用 户 集合 、 源 领域 物品 集合 与 目标 领域 物品 集合 
9.,9 源 领域 的 交互 图 与 目标 领域 的 交互 图 
NANO 在 9 上 的 邻居 、2 在 9 上 的 邻居 和 v 的 邻居 
ei? ei 第 1 层 图 卷 积 输出 的 用 户 表示 与 物品 表示 
h,.h, 图 卷 积 模块 提取 的 用 户 表示 与 物品 表示 
hi hie” ki 用户 的 语义 隐 变 量 、 领 域 隐 变 量 、 噪 声 隐 变 量 
Yws w u 5j v 是否 交 互 的 真实 值 与 预测 值 
d,.d, 领域 分 类 器 输出 的 用 户 uc 领域 的 预测 值 


在 训练 阶段 的 每 个 批 次 ， 本 文 从 4 中 均匀 采样 一 批 用 户 ， 
| 练 集中 随机 采样 一 个 交互 过 的 
本 ， 再 从 立 中 均匀 采样 一 个 未 交互 过 的 物品 
we 对 目标 领 也 进行 同样 的 采样 。 
22 ”模型 设计 


对 于 每 个 用 


物品 六 作为 正 村 


作为 负 样本 


户 ， 从 源 领域 的 


2.3 


本 文 
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图 3 模型 结构 
Fig.3 Model structure 


BUE SEE 


取 划 
B BR 
XA 
由 于 


指 代 


以 及 
节点 


卷 第 8 期 


谍 入 层 负责 把 节点 ID 转换 为 对 应 的 嵌入 向 量 , 具体 地 ， 
输入 用 户 “ BID, 从 跨 领 域 共享 的 用 户 嵌 入 矩阵 坟 中 提 
BN TRE eio ， 输 入 源 领域 物品 vs 的 ID， 从 源 领 域 物品 


入 矩阵 只 提取 其 肉 入 向 量 。" ， 对 于 目标 领域 ， 以 相同 方 


V, JER . MA, RABAR VVV 3x — 28 VII 
源 领域 与 目标 领域 是 对 称 的 ， 为 了 简化 公式 ，] 


v. 与 Vto 


练 参数 。 
POCHI v 


图 卷 积 层 负责 从 二 部 图 上 学 习 节 点 表示 ， 它 接收 & 或 9 
目标 节点 作为 输入 ， 以 目标 节点 为 中 心 ， 逐 层 聚 合 邻 域 


的 表示 ， 公 式 如 下 : 
Wi? [lei || ei^] 


eum = X 1 | 
SX, NM INT, 


1 
e = 5 WP [e |et^] 
MA T0707 
h, =llkoe? 


=] et 
h, — ll: et^ 


H. rH 


N 


的 权 


学 到 


FU W, 


6) 


(4) 


6) 
(6) 


,| 表示 向 量 拼 接 操 作 ，A 表示 节点 wu RA. WE ei tm 
Wei “是 第 1 层 图 卷 积 网 络 的 可 训练 参数 ， 本 文 用 不 同 


重 


阵 建 模 以 不 同 节 点 为 中 心 的 聚合 函数 ， 和 希望 网 络 能 


用 户 与 物品 之 间 非 对 称 的 关系 。 本 文 谷 加 多 层 图 卷 积 ， 


每 层 


拼接 
2.4 


入 隐 


co 和 噪声 向 量 Wr 。 "表示 用 户 跨 领 域 的 兴趣 ， 


获得 用 户 节点 表示 丸 与 物品 节点 表示 丸 。 
解 耦 模块 


为 了 获得 解 耦 的 用 户 兴 趣 表 示 ， 本 文 进 一 步 把 六 分 别 输 


图 卷 积 的 输入 是 上 一 层 的 输出 。 最 后 ， 把 每 一 层 的 输出 


变量 解 耦 模块 ， 获 得 用 户 语义 向 量 改 " ， 用 户 领域 向 量 


J 用 于 计 


算 与 物品 的 得 分 ; 而 必 " 仅 包含 与 领域 有 关 的 信息 , 用 于 输入 
领域 判别 器 预测 样本 的 领域 ; he" 包含 与 领域 和 语义 都 无 关 的 
噪声 。 本文 用 MLP 网 络 作为 语义 编码 器 与 领域 编码 器 ,其 公 
式 如 下 : 


本 文 从 生成 模型 的 角度 去 考虑 跨 领 域 推荐 问题 


现 参考 了 图 


框架 如 图 3 


所 示 。 模 型 由 


自 编 码 器 9， 整体 上 由 编码 器 与 解码 器 
BAS RERE HA 


， 模 型 的 实 
组 成 ， 模 型 
模块 、 领 域 


判别 器 、 源 领域 得 分 预测 器 、 目 标 领 域 得 分 预测 器 和 重 构 模块 


这 7 个 部 分 组 


成， 本 文 在 后 续 章 节 中 详细 介绍 每 一 个 模块 。 


N 


2.5 


hi" 输入 评分 预测 器 , 以 评分 作为 监督 新 号 , 从 中 提取 有 关 
的 信息 。 考 虑 到 本 文 没有 用 到 除 物品 YD. 外 的 其 他 特征 ， 
采用 与 物品 表示 的 内 积 作为 预测 的 评分 , 并 采用 BPRÜ?I 


语义 
本 文 
损失 


HHA, 


hi" = MLP(h,; Osen) 
hi^" = MLP, ; Oam) 
hi? = MLP(h, ; Oroi) 


0, , Cim 和 0 为 MLP 网 络 的 可 训练 参数 。 


(7) 
(8) 
(9) 


领域 判别 器 、 源 领域 得 分 预测 器 和 目标 领域 得 分 预测 器 


于 推荐 任务 的 语义 信息 是 用 户 对 物品 的 评分 ， 


函数 进行 训练 ， 公 式 如 下 : 
Ĵa 7 (in. h,) 


本 文 把 


(10) 


基于 图 生成 过 程 的 跨 领 域 推荐 


-Ino(3, — Puw) (11) 


L-»2 
ucl veN, v 


Hp, eO 是 Sigmoid 函数 ,vy' 是 从 物品 集合 中 均匀 采用 的 未 
与 用 户 交 互 过 的 物品 ， 即 负 样 本 。BPR(Bayesian Personalized 
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录用 定稿 蔡 瑞 初 ， 等 : 


Digital Music 较为 相近 ， 物 品 语义 与 交互 网 络 的 稀疏 程度 都 
相似 ; 而 第 二 组 中 ， 目 标 领域 Books 的 稀疏 程度 与 物品 数量 
都 远 超 源 领 域 Movies， 因 此 比 第 一 组 数据 集 更 有 挑战 性 。 关 
于 数据 集 的 划分 ， 本 文采 用 留 一 法 (Leave-one-oubDBl， 首 先 把 


Ranking, BPR)B9 损 失 函 数 并 不 直接 优化 预测 的 得 分 ,而 是 最 
大 化 正 样本 与 负 样本 得 分 的 差 值 ， 使 模型 学 到 “ 相 比 于 v", 
u 更 喜欢 v” 这 个 偏好 。 


每 个 用 户 交 互 过 的 商品 按时 间 惟 升序 排序 ， 选 择 最 后 一 个 商 
品 作为 训练 集 ， 倒 数 第 二 个 商品 作为 验证 集 ， 剩 余 的 商品 作 
为 训练 集 。 为 了 保证 数据 质量 ， 本 文 仅 保 留 交互 次 数 大 于 3 


nt 


对 应 的 , 本 文 把 用 户 领域 向 量 必 " 输入 领域 判别 器 ,以 领 的 用 户 和 商品 ， 且 保证 每 个 用 户 在 源 域 和 目标 域 都 有 交互 记 
域 标签 du 作为 输入 监督 信号 ， 若 物品 来 自 源 领域 ，&=0， 和 否 录 。 最 后 ， 关 于 用 户 与 商品 的 特征 选择 ， 本 文 关 注 的 是 结构 
则 d=1。 领 域 判别 器 采用 一 个 MLP 网 络 实现 ， 并 采用 交叉 信息 在 跨 领 域 推荐 的 作用 ， 为 了 公平 比较 各 种 方法 ， 输 入 特 
WTEZXJAAER AAT: 征 仅 包含 用 户 ID 与 物品 ID. 
d, = MLP(h?;Q,,) (12) 表 2 Amazon 数据 集 的 统计 信息 
E -Y, log(d,)-- (1—4,)log(1 -d,) (13) - Tab. 2 Amazon PUE uu 
La 28 8 户 数量 《物品 数量 《交互 数量 MAEA) 
dB, 6, 是 领域 判别 器 的 可 训练 参数 。 CDs 112,532 504,679 0.0223 
D. 20,084 
2.6 重 构 模块 Digital Music 30,393 148,562 0.0243 
为 了 重 构 输入 的 图 结构 ， 从 而 最 大 程度 的 保留 图 的 结构 Movies Gea 54,003 1,439,951 0.0268 
信息 ， 本 文采 用 了 图 自 编码 器 P8 的 做 法 ， 用 两 个 节点 表示 的 Books 504,017 — 2,718,225 0.0054 
内 积 作为 边 存在 的 概率 ， 以 此 恢复 输入 图 的 邻接 矩阵 。 本 文 3.2 实验 设置 
利用 一 个 MLP EIRE TAERE RI me hir 和 2， 以 此 作 对 于 商品 推荐 任务 ， 学 术 界 普遍 采用 的 留 一 法 (Leave- 


为 用 于 重 构 的 用 户 表 示 必 。 考 虑 到 完整 的 邻接 矩阵 过 于 庞大 ， 
本 文 仅 恢复 用 户 节 点 所 在 网 络 的 局 部 结构 ， 并 采用 word2vec 
的 负 采 样 技术 。 重 构 模 块 的 公式 如 下 : 

h; = MLP; |“ (14) 


i= 之 2, logo Rig b) + 2 log - o (Ch; ,h,))) (15) 


其 中 4 是 可 训练 参数 , 源 领 域 与 
2.7 ”模型 训练 与 测试 

在 训练 阶段 ， 本 文 分 别 计算 源 领域 与 目标 领域 的 得 分 损 
REME ， 领 域 分 类 器 的 损失 ， 源 领域 与 目标 领域 的 重 
构 损 失 石 和 如 ,以 及 对 所 有 模型 参数 @ m L2 正则 化 项 le 用。 
模型 的 总 损失 函数 如 下 : 


L=B+b, +aLy + (L; *L)«A||olg (16) 


标 领 域 的 重 构 模 块 共享 参数 。 


one-out) 进 行 评估 ， 即 保留 每 个 用 户 最 新 的 交互 用 于 测试 , 第 
二 新 的 交互 作为 验证 集 ， 用 于 调整 超 参数 ， 剩 余 的 交互 作为 
训练 集 。 在 测试 时 ， 对 于 每 个 用 户 ， 模 型 为 所 有 的 候选 物品 
打分 并 按照 得 分 降序 排序 , 然后 返回 得 分 最 高 的 前 N 个 物品 
作为 该 用 户 的 推荐 结果 ， 这 种 任务 被 称 为 Top-N 推荐 。 由 于 
同时 考虑 所 有 候选 物品 的 计算 量 过 大 ， 本 文 参考 B] 的 策略 ， 
随机 采样 500 个 没有 与 用 户 交互 过 的 物品 作为 负 样本 ， 然 后 
评估 模型 把 正 样本 (测试 物品 ) 排 在 负 样 本 前 的 能 力 。 典 型 的 
Top-N 评估 指标 有 HR(Hit Rate) 和 NDCG(Normalized 
Discounted Cumulative Gain). HR 衡量 测试 物品 是 否 存在 于 
模型 输出 的 Top-N 列表 中 ， 其 定义 如 下 : 


HRON - 5. y (y < N) (17) 
(U [in 


其 中 ，e 是 控制 领域 损失 权重 的 超 参数 ， 默 认 值 为 0， 是 
控制 重 构 损 失 的 超 参数 ， 默 认 值 为 le-3，4 是 控制 L2 正则 
化 权重 的 超 参数 ， 默 认 值 为 1e-5，。 本 文采 用 Adam 优化 器 
优化 总 损失 函数 并 更 新 模型 参数 。 

在 测试 阶段 , 由 于 本 文 只 关注 目标 领域 的 用 户 -物品 得 分 ， 
本 文 仅 计算 图 卷 积 层 的 式 (3)~(6) 与 语义 编码 器 的 式 (7) 的 输 
出 , 然后 通过 式 (10) 获 得 目标 领域 的 预测 得 分 , 其 他 与 目标 领 
域 任务 无 关 的 模块 不 需要 计算 。 


3 ”实验 设 计 与 分 析 


3.1 数据 集 介绍 

Amazon 2018 评论 数据 集 (https://nijianmo.github.io/amazon/ 
index.html) 该 数据 集 由 Amazon 电 商 平台 上 1996 年 6 月 至 
2018 年 10 月 的 共 2.3 亿 条 商品 评论 构成 ， 每 条 评论 包含 用 
户 ID、 商 品 ID、 时 间 戳 、 评 论文 本 、 用 户 评分 以 及 商品 的 元 
数据 (类 别 、 品 牌 、 描 述 、 图 像 特征 等 )。Amazon 评论 数据 集 
为 跨 领 域 推荐 提供 了 一 个 测试 平台 ， 具 体 任务 是 为 用 户 推荐 
他 可 能 会 交互 的 商品 。 为 了 把 显示 反馈 的 评分 转换 为 隐 式 反 
馈 的 形式 ， 本 文 仅 保 留 评 分 大 于 等 于 3 的 评论 作为 样本 。 然 
后 ， 本 文 根 据 商品 类 别 划分 评论 数据 集 ， 每 个 类 别 商品 的 评 
论 作为 一 个 领域 ， 选 择 其 中 数据 较为 丰富 的 CDs、Digital 
Music, Movies 和 Books 分 别 作为 源 领 域 和 目标 领域 ， 各 个 
数据 集 的 统计 信息 见 表 2, Hp " 一 ”两 边 的 数据 集 分 别 
代表 源 领 域 和 目标 领域 。 


Yit 


其 中 是 用 户 2 的 测试 物品 在 返回 的 Top-N 列表 中 的 排序 ， 

5() 代表 指示 函数 (indicator function), NDCG 在 HR 的 基础 上 
考虑 了 测试 物品 的 具体 排名 ， 其 定义 如 下 : 

1 log2 

NDCG@N = Doe (18) 

测试 物品 在 Top-N 列表 中 的 排名 越 靠 前 ， 则 权重 越 大 。 

对 于 HR 和 NDCG， 指 标 越 高 代表 模型 表现 越 好 ， 本 文 给 出 

N=[5,10] 的 实验 结果 。 

本 文 基于 PyTorch (https://pytorch.org/) 和 Deep Graph 
Library (https://github.com/dmlc/dg1) 框 架 实现 了 所 有 的 基线 模 
型 ， 并 提供 可 复 现 的 Python 代码 (https://github.com/rynewu224/ 
CrossDomainGNNRec)。 所 有 实验 的 运行 环境 为 : Windows 10 系 
统 ，RTX 3080Ti GPU，AMD Ryzen7 5800X CPU 和 64G 内 存 。 
3.8 基线 方法 
本 文 与 多 种 基线 方法 进行 对 比 ， 其 中 包括 基于 协同 过 滤 
的 方法 、 基 于 图 的 推荐 方法 以 及 跨 领 域 推荐 方法 。 本 文 设计 
了 两 组 对 比 实验 ， 表 3 与 表 4 中 的 单 领域 表示 仅 利用 目标 域 
的 数据 训练 模型 ， 跨 领域 表示 利用 源 域 和 目标 域 的 数据 协同 训 
练 ， 其 中 用 户 典 入 向 量 是 共享 的 。 所 有 基线 方法 的 介绍 如 下 : 
基于 协同 过 滤 的 方法 BPRMF64 是 隐 因 子 协 同 过 滤 的 
经 典 方法 ， 利 用 用 户 向 量 与 物品 向 量 的 内 积 作 为 推荐 任务 的 
得 分 , 并 优化 BPR 损失 函数 以 最 大 化 正 样本 得 分 与 负 样 本 得 
分 的 差 值 。 
MLP 利用 多 层 感 知 机 (Multilayer Perceptron, MLP) 预 测 


表 2 可 知 ， 第 一 组 数据 集 的 源 领域 CDs 与 目标 领域 


] 户 与 物品 之 间 的 得 分 ， 各 个 隐 层 的 维度 为 [40,20,10,1]， 激 
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活 函数 使 用 ReLU。 


物品 向 量 的 逐 元 素 相 乘 作为 MLP 的 特 生 


rude, F: 基于 图 生成 过 程 的 跨 领 域 推荐 


算 代价 的 权衡 ， 本 文采 | 
NeuMFB] 结 合 矩 阵 分 解 与 多 层 感知 机 ， 引 入 用 户 向 量 与 


合 内 积 函 数 的 问题 。 


图 中 的 高 阶 领 域 信 息 。 
的 效果 最 好 。 


LightGCNP9 是 NGCF 的 改进 版 本 ， 
特征 变换 和 非 线 性 层 ， 仅 聚合 领域 特征 。 


对 比 实验 中 本 文 堆 合 2 个 图 卷 积 层 。 
跨 领域 推荐 方法 


识 迁 移 的 效果 。 
损失 函数 权重 相等 。 


DANNB35 是 计算 机 视觉 上 经 典 的 领域 自 适 应 方法 ， 它 利 
用 梯度 翻转 层 (Gradient Reverse Layer, GRL) 和 域 分 类 器 学 习 
本 文 把 它 适 配 于 推荐 任务 ， 语 义 特征 
j 的 骨干 网 络 是 2 层 LightGCN, 由 于 跨 


领域 无 关 的 语义 特征 ， 
代表 用 户 的 兴趣 。 采 1 
领域 的 


基于 图 的 推荐 方法 NGCFR?8] 将 GCN 应 用 于 协同 过 滤 
模型 ， 在 聚合 领域 信息 的 过 程 中 ， 额 外 考虑 了 用 户 与 物品 之 
间 的 相似 性 。 同时， 又 加 多 层 图 卷 积 可 以 提取 用 户 -物品 二 部 
在 对 比 实验 中 ， 本 文 发 现 2 层 图 卷 积 


CMFUSI 将 两 个 领域 的 数据 联合 起 来 
进行 矩阵 分 解 ， 通 过 共享 的 中 间 变 量 (用 户 嵌 入 和 矩阵) 实现 知 
在 对 比 实验 中 ， 本 文 令 源 领域 与 目标 领域 的 


是 用 户 ， 用 户 表示 向 量 包 含 领域 相关 信息 ， 
户 表 示 上 添加 梯度 翻转 层 与 域 分 类 器 ， 同 时 ， 再 加 


E, Zt MLP 难以 拟 


去 除 每 层 图 卷 积 的 
与 NGCF 一 样 ， 在 


本 文 在 用 


个 全 连 


接 层 编码 用 户 的 兴趣 向 量 ， 并 利用 这 个 兴趣 向 量 进行 推荐 。 
户 跨 领域 推荐 与 图 神经 
网 络 结合 的 方法 ， 它 首先 用 图 神经 网 络 从 社交 网 络 上 提取 用 


CD-GNNB3 引 是 近期 提出 的 一 种 ) 


户 表示 ， 然 后 利用 一 个 领域 不 变 层 (Domain Invariant Layer) 1f 
涌 来 自 不 同 领域 的 用 户 表 示 ， 并 附加 一 个 域 分 类 器 训练 域 不 


变 层 。 
预测 得 分 。 
对 于 所 有 基于 图 的 算法 ， 本 文 构建 


最 后 ， 拼 接 用 户 表示 与 物品 表示 ， 用 


的 输入 图 包含 所 有 用 


层 全 连接 网 络 


户 与 商品 节点 ， 但 边 集 仅 包 含 训练 集 的 边 。 因 此 ， 输 入 图 是 


异 质 的 ， 它 包含 用 户 、 源 域 物品 、 目 标 域 物品 这 3 种 节点 ， 


以 及 用 户 - 源 域 物品 、 源 域 物品 -用 户 、 用 户 -目标 域 物品 、 目 


标 域 物品 -用 户 这 4 种 边 。 


为 了 进行 公平 的 对 比 实验 ， 对 于 所 有 的 基线 方法 ， 本 文 


训练 最 多 遍历 1000 次 数据 集 ， 并 采 


训练 ， 
le-3，L2 正则 化 系数 为 le-4， 批 次 大 小 
率 为 0.2。 

3.4 超 参 数 敏 感性 分 析 


T 


本 节 探 究 本 文 的 模型 中 几 个 重要 超 参数 的 ， 包 括 嵌 入 层 维 
度 大 小 、BPR 损失 函数 的 负 样 本 比例 、 以 及 工 2 正则 化 系数 4 。 


首先 ， 本 文 固定 了 模型 的 其 他 超 参 数 ， 然 后 采用 
[10,20,30,40] I] A JE 2f 
在 两 个 任务 中 ， 提 升 嵌 入 维 
弱 的 提升 , 与 默认 维度 
本 上 足够 了 ， 而 提升 维 
文 的 模型 对 嵌入 层 维度 


维度 是 20。 


取 值 范围 [1,5,10,20,50,100], 实验 结果 如 


有 着 显著 且 稳 定 的 提升 ,比例 提升 到 100 


] 早 停止 (early stopping) 
策略 ， 即 在 目标 领域 的 验证 集 误差 未 下 降 的 5 次 迭代 后 结束 
且 所 有 方法 均 使 用 Adam 优化 器 进行 训练 ， 学 习 率 为 


为 1024，dropout 概 


度 大 小 进行 实验 ， 结 果 如 图 4 所 示 。 
度 至 40 依然 可 以 获得 稳定 但 微 
20 的 差别 过 小 , 可 以 认为 模型 容量 基 
度 导 致 计算 代价 几乎 翻 倍 。 因 此 ， 本 
大 小 并 不 敏感 ， 在 实验 中 采用 的 嵌入 


其 次 ， 本 文 还 尝试 不 同 的 BPR 损失 函数 的 负 样 本 比例 ， 


5 所 示 。 在 CDs 一 


Digital Music 任务 上 ， 负 样本 比例 从 1 提升 到 50， 模 型 效果 


时 ,效果 略微 下 降 ， 


这 可 能 是 大 量 的 负 样 本 中 包含 了 训练 集中 未 观测 到 的 测试 样 


本 导致 的 。 在 Movies 一 Books 任务 上 ， 各 指标 的 
目标 领域 高 度 稀 琉 造成 的 。 
样本 比例 是 有 助 于 模型 训练 的 。 在 实验 中 ， 考 虑 到 性 能 与 计 


组， 可 能 是 


线 较为 平 
因此 ， 适 当 增 大 负 


评价 指标 


0.15 


0.35 


0.10 


评价 指标 


0.20 4 


0.15 
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图 4 嵌入 层 维度 的 敏感 性 分 析 


Fig.4 Sensitivity analysis of embedding size 


CDs 一 Digital Music 


0. 4219 
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1 10 20 100 
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图 5 负 样 本 个 数 的 敏感 性 分 析 


Fig. 5 Sensitivity analysis of #negative samples 


最 后 ， 
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mae, F 


le-6, 1e-5, 1e-4, 1e-3, 1e-2, le-1]， 实 验 结果 如 图 


CDs- Digital Music 
而 在 Movies Books 
即使 在 A 设置 为 0 


任务 上 ， 
任务 上 ， 


对 不 敏感 。 当 


6 所 示 。 在 


A =1e-3 取得 了 最 好 的 效果 ， 
A =1e-2 取得 了 最 好 的 效果 。 
时 , 本文 的 模型 对 AL 也 相 
A 大 于 1e-2 时 ， 性 能 下 降 很 快 ， 说 明正 则 化 过 强 会 对 模型 


0.10 


RUN d E DP 2 
的 正常 训练 产生 负面 影响 。 本 文采 用 的 A 是 le-3。 
CDs 一 Digital Music 
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图 6 L2 正则 化 系数 的 敏感 性 分 析 


Fig.6 Sensitivity analysis of L2 normalization weight 


3.5 实验 结果 


本 文 给 出 实验 CDs 一 Digital Music 与 Movies 一 Books 的 


结果 ， 如 表 3 与 表 4 所 示 。 对 于 每 组 实验 ， 本 文 分 别 使 用 5 个 


不 同 的 随机 种 子 


计算 平均 的 实验 结果 ， 


表 3 实验 CDs- Digital Music 的 目标 领域 测试 和 


最 好 的 结果 加 粗 显示 。 


gE 


RH 


Tab. 3 Target test set results on cds— Digital Music 


模型 HR@5 HR@10 NDCG@5 . NDCG(10 
MF 0.1668 — 0.2029 0.0933 0.1044 
[3 MLP 0.1435 — 0.1994 0.0710 0.0882 
领 NeuMF 0.1466 0.2118 0.0721 0.0921 
域 NGCF 0.1802 — 0.2540 0.0905 0.1131 
LightGCN 0.2746 — 0.3457 0.1466 0.1685 
CMF 0.19533 — 0.2363 0.1059 0.1190 
MLP 0.1506 — 0.2124 0.0749 0.0938 
NeuMF . 0.1506 0.2136 0.0752 0.0945 
跨 NGCF 0.2314 0.3076 0.1192 0.1426 
领 LightGCN — 0.3088 0.3868 0.1631 0.1871 
域 ^ DANN 0.21016 — 0.2733 0.1109 0.1298 
CD-GNN 0.1479 02144 0.0734 0.0938 
Ours 0.3427 0.4130 0.1830 0.2047 
相对 提升 11.0% — 6.7896 12.2596 9.4494 
与 单 领域 推荐 方法 相 比 ， 本 文 的 方法 有 着 巨大 的 优势 ， 
在 所 有 任务 上 都 获得 了 最 佳 的 效果 。 同 时 ， 利 用 了 图 信息 的 
NGCF 5 LightGCN 显著 优 于 没有 利用 图 信息 的 MF. MLP 


等 : 基于 图 生成 过 程 的 跨 领 域 推荐 


和 NeuMF， 说 明 图 卷 积 层 提取 的 用 
息 有 助 于 推荐 任务 。 
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户 -物品 交互 图 的 结构 信 


在 


领域 失 


荐 的 实验 上 ， 本 文 的 方法 同样 优 于 所 有 基线 


方法 。 


首先 ， 跨 领域 的 方法 在 大 多 数 结果 上 优 于 单 领域 的 方 
与 单 领域 版 本 相 比 在 HR@5 上 普遍 取得 1-2 个 百分点 的 


提升 ， 说 明了 跨 领 域 知识 迁移 的 有 效 性 。 其 次 ， 在 跨 领 情况 


下 ， 图 卷 积 方法 
果 在 两 个 实验 中 都 与 CMF 不 相 上 下 ， 效 果 远 不 如 其 骨干 网 


依旧 优 于 协同 过 滤 方 法 。 此 外 ，DANNN 的 效 


络 LightGCN, 说 明了 传统 的 基于 计算 机 视觉 的 领域 自 适应 技 


术 并 不 使 用 于 


Eh. CD-GNN 效果 不 如 CMF 的 原因 可 


能 是 ， 原 文 利用 


I 户 -用 


ERZ, 且 预 测评 分 的 单 层 全 连接 并 不 能 建 模 用 


了 社交 网 络 的 信息 ， 但 大 多 数 场景 不 能 获得 


hi5 


物品 的 交互 。 最 


结构 信息 中 提取 
K4 实验 Movies 一 Books 的 目标 领域 测试 集结 果 


后 ， 本 文 的 方法 好 于 其 他 跨 领 域 推荐 方法 ， 


与 最 好 的 基线 方法 相 比 ， 在 HR@5 上 平均 提升 14.11%， 在 
NDCG@5 上 平均 提升 135.32%， 说 明了 解 耦 模块 能 有 效 地 从 


]P GER 


Tab.4 Target test set results on Movies Books 

模型 HR@5 HR@I10 NDCG@5 NDCG@10 
MF 0.1441 0.1911 0.0757 0.0900 
单 MLP 0.1548 — 0.2091 0.0798 0.0964 
4 NeuMF 0.1578 — 0.2128 0.0812 0.0980 
域 NGCF 0.1849 — 0.2503 0.0955 0.1155 
LightGCN 0.2099 0.2799 0.1087 0.1301 
CMF 0.1636 0.2212 0.0848 0.1025 
MLP 0.1636 0.2200 0.0845 0.1018 
NeuMF 0.1566 0.2149 0.0805 0.0984 
跨 NGCF 0.1978 0.2654 0.1021 0.1229 
领 LightGCN 0.2057 0.2748 0.1068 0.1280 
Bü DANN 0.1627 — 0.2213 0.0838 0.1017 
CD-GNN 0.1515 02124 0.0770 0.0957 
Ours 0.2460 — 0.3125 0.1287 0.1489 
相对 提升 17.22% — 11.6496 18.3994 14.4496 


3.6 ”消融 实验 


综 上 ， 本 文 的 模型 显著 优 于 单 领域 的 推荐 方法 ， 
于 现 有 的 跨 领域 推荐 方法 有 较 大 提升 。 


正如 前 一 节 所 讨论 的 ， 本 文 提出 的 模型 比 其 他 基线 方法 
有 了 显著 的 提升 。 这 些 改 进 实 际 上 来 自 于 将 
到 推荐 模型 的 设计 中 : 解 耦 模块 ， 它 统一 了 两 个 领域 中 用 户 
表示 的 学 习 过 程 ， 语 义 编 码 器 提取 用 
提取 领域 相关 的 噪声 ， 以 及 重 构 模 块 ， 
重 构 输 入 的 图 ， 保 证 了 结构 信息 不 会 流失 。 在 本 节 中 ， 本 文 
进行 消融 实验 以 证 明 每 个 组 件 的 重要 性 ， 将 提出 的 模型 与 以 


下 变 体 进行 比较 : 
-Gen: 在 原 模型 的 基础 上 ， 


相对 


uu 


个 新 组 件 整合 


户 的 兴趣 ， 领 域 编码 器 
结合 用 户 与 物品 表示 


pan 


1 除 图 重 构 模块 。 


-Dom: 在 原 模型 的 基础 上 , 删除 领域 编码 器 与 领域 分 类 器 。 


-Disen: 在 原 模型 的 基础 上 ， 


删除 整个 解 耦 模块 。 


如 表 5 所 示 ， 如 果 将 任何 一 个 模块 从 推荐 模型 中 移 除 ， 


都 导致 HR 5 NDCG 指标 的 显著 降低 。 因 此 ,消融 实验 表明 ， 
本 文 提出 的 模型 的 优势 实际 于 这 
块 在 双 领 域 协同 学 习 的 模型 中 发 挥 了 重要 作 / 


高 的 跨 域 推荐 怕 


3.7 EBIT IRE 
为 了 可 视 化 模型 的 学 习 结 果 ， 本 文 随 机 选择 100 个 活跃 
户 ( 交 互 行为 大 于 
标 领 域 物品 ， 再 把 训练 后 的 | 
后 用 TSNE 算法 
的 方法 在 CDs 一 Digital Music 数据 集 上 的 可 视 化 结果 如 图 


T 


上 来 自 于 这 些 新 模块 ， 这 些 新 模 


j， 都 有 助 于 提 


E 
HE o 


10)， 并 查询 用 户 评价 过 的 源 领域 物品 和 
户 向 量 与 物品 向 量 拼接 ， 最 
投影 到 2 维 平面 。NGCF、LightGCN 与 本 文 


202204.00063v1 


" 
m 


chinaXiv 


录用 定稿 
7~9 所 示 。 
表 5 消融 实验 
Tab.5 Ablation study 
数据 集 模型 Hà5 H@10 Nà5 N@10 
Ours 0.3427 0.4130 0.1830 0.2047 
CDs— Digital Music -Gen 0.3369 0.4082 0.1805 0.2025 
-Dom 0.3203 0.3828 0.1760 0.1946 
-Disen 0.3183 0.3789 0.1706 0.1898 
Ours 0.2460 0.3125 0.1287 0.1489 
全 SSE -Gen 0.2431 0.3115 0.1254 0.1467 
-Dom 0.2343 0.2968 0.1242 0.1430 
-Disen 0.2197 0.2998 0.1160 0.1405 
NGCF - CDs —>Digital Music 
图 7 NGCF 的 TSNE 降 维 结 
Fig.7 TSNE projection of NGCF 
LightGCN - CDs 5 Digital Music 
A 
* 
*- aos » 
Ld T 
* - we 
图 8 LightGCN 的 TSNE 降 维 结果 
Fig.8 TSNE projection of lightgcn 
本 文 的 方法 - CDs Digital Music 
E 4 
图 9 ”本文 的 方法 的 TSNE 降 维 结果 
Fig.9 TSNE projection of our method 
在 图 7~9 中 ， 红 点 代表 投影 后 的 源 领域 物品 向 量 ， 蓝 点 
代表 投影 后 的 目标 领域 物品 向 量 。 可 以 观察 到 ，NGCF 的 物 


品 向 量 投影 较为 分 散 ， 没 


区 成 能 状 结构 ， 这 表示 模型 未 能 


3j 


较 多 的 能 ， 但 源 领域 与 
物品 向 量 


物品 对 应 的 用 


户 兴趣 ; LightGCN 的 物品 向 量 投影 形成 了 
标 领 域 的 艇 独立 存在 ， 即 两 个 域 的 
能 对 齐 ， 有 碍 于 表达 跨 领域 不 变 的 用 户 兴 趣 ; 本 


文 的 方法 的 物品 向 量 投 影 在 呈现 簇 结构 的 同时 ， 源 领域 与 目 


标 领 域 的 物品 向 量 充分 融合 ， 


这 表明 本 文 的 方法 能 有 效 解 厢 


出 不 随 着 领域 改变 的 用 户 兴 


4 


本 文 利 用 图 


结束 语 


本 文 从 图 的 生成 过 程 角度 对 跨 领 域 推荐 方法 进行 了 研究 ， 
自 编码 器 把 从 用 户 -物品 二 部 图 提取 的 用 户 表示 


H 


rude, F: 基于 图 生成 过 程 的 跨 领 域 推荐 


解 耦 为 多 个 独立 的 隐 变 量 ， 并 准确 提取 了 目标 用 户 的 跨 领 域 
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文 在 
法 相对 于 现 有 的 跨 领 域 
积 模块 尝试 更 先进 的 框架 ， 


局 好 ， 提 出 一 种 基于 图 生成 过 程 的 跨 领 域 推荐 方法 。 
] 个 真实 数据 集 上 进行 了 大 量 实验 ， 结 果 表 明 本 文 的 
荐 方法 有 较 大 提升 。 未 来 将 在 图 
以 及 考虑 多 源 领 域 的 迁移 。 
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